#квантование с учётом задач22.04.2025
Исследователи UNC представили TACQ: сохранение точности LLM при 2-битном квантовании с учётом задач
Исследователи из UNC Chapel Hill представили TACQ — метод квантования, который сохраняет критически важные весовые цепи и позволяет большим языковым моделям сохранять высокую точность даже при 2-битном сжатии.